一只不会飞的小鸟的数据挖掘之路——WEKA(良心推荐)
点击蓝字
关注我们
2012年,荷兰学者Lambin等提出了放射组学——Radiomics,通过从大量放射影像中提取大量特征,采用各种自动化数据特征算法将传统影像转化为具有高分辨率的、内涵丰富信息的可挖掘数据。
如今,樊代明院士又提出整合医学,不仅要把已知的各生物因素加以整合而且要将心理因素、社会因素和环境因素加以整合;不仅需要将现存与生命相关各领域最先进的医学发现加以整合而且要求将现存与医疗相关各专科最有效的临床经验加以整合。
这无疑又将更多的数据整合在了一起,那么大数据时代,医生朋友们应该怎么利用大量的数据,提取特征、挖掘有用特征并最终用于诊断呢?很多医生朋友会说,我不懂分类器,不会编程,不知道各种算法还怎么做数据挖掘?
我们这期为大家隆重推荐一款数据挖掘软件,WEKA——怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA的开发者来自新西兰,而新西兰有一种鸟名字叫做weka,便是weka图标上的那只。是一款免费的,非商业化的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。WEKA系统汇集了最前沿的机器学习算法和数据预处理工具,以便用户能够快速灵活地将已有的处理方法应用于新的数据集。
功能简介
WEKA主界面为WEKA GUI选择器,它通过右边的四个按钮提供四种主要的应用程序供用户选择。
其中最常用的是Explorer选项,是系统提供的最容易使用的图像用户接口。通过选择菜单和填写表单,可以调用weka的所有功能。
将整理好的数据全部导入,在界面中选择适当的预处理(上采样、下采样等)、分类器(SVM、logistic回归等)和特征选择方法。训练选项有四种,常用的是交叉验证,即把数据集分成若干份,1份作为验证集,其余部分作为训练集。这样的方法保证了数据集的所有元素都被验证过。
其他的,Experimenter选项用于设计自己的实验模型,KnowledgeFlow选项用于设计挖掘流程,类似于流程图,Simple CLI选项则是命令行界面,执行简单操作。
当然,这么强大的软件还有很多很多功能,只有实战后才会有更深的体验。
实用链接
http://www.cs.waikato.ac.nz/ml/weka/(官网)
http://www.cs.waikato.ac.nz/ml/weka/downloading.html(下载页面)
崔光彬 第四军医大学唐都医院放射诊科主任医师、教授,中国医学影像技术研究会常务理事、中华放射学会青年委员会委员、中华放射学分会磁共振专委会委员、中国微循环学会神经变性病专委会磁共振学组副主任委员、中国医师协会神经放射专业委员会副主委、中国研究型医院放射专业委员会常务委员、中国装备协会CT常务委员、全军放射学会青年委员会副主委、陕西省放射学分会常务委员、陕西省抗癌协会影像诊断分会常委兼秘书、陕西省放射诊疗质控中心委员、陕西省抗癌协会肿瘤综合治疗专业委员会常务委员、陕西省抗癌协会大肠癌专业委员会常务委员、西安市放射学分会副主委。
-end-
没看够?
亲,您别着急
下期将有更多精彩内容
敬请留意,谢谢!
老年痴呆诊治及磁共振安全检查、数据处理相关知识科普,临床科研好助手,一天一原创,每日一更新。
推荐指数:★★★★★
请长按下方二维码,识别关注。
点击“阅读原文”打开新页面